home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / doc / www_talk.arc / 000058_timbl _Wed Mar 4 10:42:32 1992.msg < prev    next >
Internet Message Format  |  1992-11-30  |  6KB

  1. Return-Path: <timbl>
  2. Received: by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA17545; Wed, 4 Mar 92 10:42:32 GMT+0100
  4. Date: Wed, 4 Mar 92 10:42:32 GMT+0100
  5. From: timbl (Tim Berners-Lee)
  6. Message-Id: <9203040942.AA17545@ nxoc01.cern.ch >
  7. Received: by NeXT Mailer (1.62)
  8. To: jcurran@nnsc.nsf.net
  9. Subject: Re: Draft: Universal Document Identifiers
  10. Cc: cni-arch@uccvma.bitnet@nnsc.nsf.net, wais-talk@think.com,
  11.         www-talk@nxoc01.cern.ch
  12.  
  13. > Date: Thu, 27 Feb 92 19:45:42 -0500
  14. > From: jcurran@nnsc.nsf.net
  15.  
  16. >Even if the exact scheme is not used, the requirement
  17. > discussion contained in the paper is quite valuable.
  18. > I have a few comments:
  19.  
  20. >] Terms
  21. >]
  22. >] The objects on the network which are to be named include
  23. >] objects which can be retrieved, and objects which can be searched.
  24.  
  25. > Using this definition, one would infer that document identifiers
  26. > would allow reference to a distinct file, a particular mail
  27. > message, news article, etc. I would not anticipate that a document
  28. > identifier would be used to identify a newsgroup, interactive
  29. > service, archive directory , or a wais source.  Are  we trying to
  30. > define a universal id or a universal document id?  Might it be
  31. > better to defer the definition of non-document resources and then
  32. > come back and make the document specific id's be a subset of a
  33. > future general resource identifier?
  34.  
  35. You are right that the UDIs were inteneded to be able to refer to any  
  36. of those things. (In the W3 world, they all look pretty similar  
  37. anyway -- they are all represented as [hyper]text objects.)  It is  
  38. largely in order to be able to make references to any of those things  
  39. that we need a UDI rather than a WAIS-DI and a W3-DI and a news-DI  
  40. etc etc.  A UDI allows references between systems, and expandability  
  41. for the future.  My answer would be that we are trying to define a  
  42. universal document id, but where "document" has the very wide  
  43. interpretation as any data which can be retrieved, viewed or  
  44. searched: anything to which you might want to make a reference.
  45. For example, a person is not a document (although to have a document  
  46. on the net representing each person might be useful... their  
  47. signature/disclaimer with links to their published works, etc etc.)  
  48. If we can't cope with the objects which are on the net now, how can  
  49. we hope to cope with the wierd things to come .. video clips from the  
  50. news last night etc...
  51.  
  52.  
  53. ] Relevance
  54.  
  55. ] The life of a name is limited by any information contained within  
  56. it which 
  57.  
  58. ] may become prematurely invalid. It is therefore necessary to limit  
  59. the 
  60.  
  61. ] contents of a name to the information required for the operations  
  62. above. 
  63.  
  64. ] Other extraneous information about the document (its size, data  
  65. format, 
  66.  
  67. ] authorization details, etc) may in general change with time and  
  68. should 
  69.  
  70. ] not be part of the name.
  71.  
  72. > The proposed document identifiers have many characteristics which 
  73.  
  74. > may change with time: storage location, access protocol, format, 
  75.  
  76. > etc. If we focus instead on the "information content" of a \
  77. > document, then it might be possible to form identifiers that are
  78. >  more robust.  Many people consider:
  79. >
  80. > file://info.cern.ch./pub/www/doc/udi1.ps      and 
  81.  
  82. > file://info.cern.ch./pub/www/doc/udi1.txt
  83. >
  84. > to be the same document; just in different formats.
  85.  
  86. Precisely. We look forward to the day when a name like
  87.  
  88.     x500:/CH/CERN/CN/TBL/TechNote-15
  89.  
  90. will be put through a name server which will return a set of  
  91. addresses. In the mean time, we don't have that ubiquitous name  
  92. server (directory) facility. So we have to make do with physical  
  93. addresses. And different versions of the same document look like  
  94. different documents. Its a shame. The plan is that UDIs can migrate  
  95. from physical addresses to registered names.
  96.  
  97.  
  98.  
  99. > It would be nice to be able to recognize this
  100. > and allow  the user (and user interface) to determine which
  101. > instance should be used for retreival.
  102.  
  103. Yes. Absolutely.  (The neatest way is for the client to send a set of  
  104. preferences over with the request, and for the server to decide which  
  105. to format to send. This is a suggestion for an evolved wais and/or  
  106. http protoccol.) Another way if for the client to ask a name server  
  107. for addresses, and retrieve the headers of each one to find out which  
  108. representation he'd prefer -- But I'd prefer all the represenattions  
  109. of the document to have the same name right down to the retrieval  
  110. protocol level.
  111.  
  112. > This recognition may only
  113. > be perform if the document id's (now being used document content
  114. > ids) contain only location and format independant data.  It is easy
  115. > to imagine that uniqueness could be assured by combining
  116. > an organization, author, and title:
  117. >
  118. >
  119. > cern.ch:www-staff:udi1 
  120.  
  121. >
  122. > ietf:osids:archdirectory-00 
  123.  
  124.  
  125. There are two functions: One, to find out whethre two documents are  
  126. the same. Two, to derive a (set of) addresses for retrieval of the  
  127. document. To be able to do the first, any unique id (like OSF/DCE  
  128. UUIDs or RFCxxxx message ids) will work. To be able to do the second,  
  129. a directory service is needed.
  130.  
  131. > Note that the actual location of the information might be far
  132. > removed from the point of creation, and the format might be
  133. > changed:
  134. >
  135. >cern.ch:www-staff:udi1;file://ftp.uu.net/doc/univeral-docids.PS.Z
  136. >cern.ch:www-staff:udi1;news:<1992Feb21.121919.1@quake.think.com>
  137. >cern.ch:www-staff:udi1;wais://nnsc.nsf.net/info-retrieval-notes?udi1
  138.  
  139. I see the usefulness of quoting both the unique identifier and the  
  140. physical address. I hope that in the future, though, one will only  
  141. need the first part "cern.ch:www-staff:udi1". That, fed into the  
  142. directory service, will produce a list of addresses.
  143.  
  144. You can, of course, still quote both: "You need document  
  145. x500:/cern.ch/www-staff/udi1 which I found on  
  146. file://ftp.uu.net/doc/univeral-docids.PS.Z".
  147.  
  148. I would also suggest that if a document has a unique registered name  
  149. then it should certainly contain that name, so that if you find it  
  150. some otherway, you can refer to it (make links to it) by its official  
  151. name.
  152.  
  153. > That's all
  154. > /John
  155.  
  156. Good points -- thanks for the input...I think more needs to go in  
  157. about registered unique names in the document.
  158.  
  159.     Tim BL
  160.  
  161.